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VBRPAHRBN UND SYSTEM ZUM BERBITSTELLBN EINER PRBISPRBCHFUNKTIONALITAT BEI 
MOB I LBN TELBKOMMUNI RATIONS ENDRICHTUNO EN DURCH TEMPORAreS HBRUNTERIaADEN BINES 
S PRACHVERARBEITUNGS ALGORI THMUS 

5 Beschreibung 

Die Erfindung betrif ft ein Verfahren zum Durchftlhren einer 
Freisprechkommunikation unter Nutzung einer 

Telekommunikationsendeinrichtung, insbesondere einer mobilen 
10 Telekoiranunikationsendeinrichtung, sowie ein System zum 

Bereitstellen einer derartigen Freisprechkommunikation und 
zur Nutzung innerhalb eines derartigen Systems entsprechend 
angepasste Vorrichtungen. 

15 Aus dem Stand der Technik sind Ober ein Telefon antufbare 
Sprachdienste bekannt, die eine implementierte, 
serverbasierte Spracherkennung (Automatic Speech Recognition, 
ASR) aufweisen. Ein an das Telefonnetz angeschlossenes 
Dialogsystem ermttglicht hierbei eine Kommunikation zwischen 

20 diesen Diensten und einem Nutzer, wobei die vorstehend 

genannte Spracherkennung eine technische Grundlage ftir diese 
Kommunikation bildet. 

Eine derartige serverbasierte Spracherkennung verfiigt in der 
25 Regel iiber Programme zur Realisierung von Algorithmen zur 
Verarbeitung digitalisierter Sprachdaten und in Folge zur 
Erkennung gesprochener Aufierungen des Nutzers. Oblicherweise 
werden auf dem entsprechenden, an das Telefonnetz 
angeschlossene Serversystem zur Verbesserung der Erkennung in 
30 einer Vorverarbeitungsstuf e der Spracherkennung 

Echokompensations- und Gerauschredukt ions verfahren 
angewendet . 

Daruber hinaus sind erste Versuche durchgefiihrt , Shnliche 
35 Spracherkennungssysteme mit entsprechenden 
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Vorverarbeitungsalgorithmen auf Telekommunikationsendgeraten 
wie z. B. einem personlichen digitalen Assistenten (PDA, 
Personal Digital Assistent) oder einem multimedialen 
digitalen Assistenten (MDA) zu implement ier en. Da hierbei 
5 jedoch zum Bereitstellen einer umfassenden Funktionalitat der 
Speicherplatz auf derartigen Endgeraten fur die fest zu 
ins tall ier ende Software im Allgemeinen nur unzureichend ist, 
wird mit den verwendeten vorverarbeitungsalgorithmen, 
insbesondere hinsichtlich deren Qualitat, nicht der Standard 
10 der serverbasierten Spracherkennungsl6sungen erzielt und 
darttber hinaus nur ein wesentlich kleineres Vokabular 
eingesetzt . 

Ein weiterer Ansatz far eine Spracherkennung basiert auf der 
15 aus der Literatur bekannten verteilten Spracherkennung 
(Distributed Speech Recognition, DSR) . Hier erfolgt die 
Vorverarbeitung auf dem an das Telefonnetz angeschlossene 
Telekommunikationsendgerat, also wie z. B. auf einem mobilen 
PDA MDA o.a., wobei hierbei als Ergebnis der Vorverarbeitung 
20 entstehende Merkmalsvektoren anschlieSend tiber das 

Telefonnetz mit reduzierter Datenrate an einen Server 
ubertragen und dort den folgenden Verarbeitungsstuf en eines 
Spracherkenners zugeleitet werden. Diese, neu zu definierende 
Schnittstellen im Ubertragungsnetz benotigende Technologie 
25 befindet sich jedoch noch in der Entwicklung und wird 

voraussichtlich erst in einigen Jahren zum Tragen kommen, 
falls dann reduzierte Datenraten bei der 

Sprachdatemibertragung noch eine wesentliche Rolle spiel en. 

30 Ferner ist bei der Nutzung von Telekommunikationsendgeraten, 
wie einem vorstehend genannten MDA oder PDA oder auch einem 
Telefon, einschlie&lich einem schnurlosen oder mobilen 
Telefon, aus einem fahrenden Fahrzeug heraus, beispielsweise 
auch zur Nutzung von Sprachdiensten, durch den Gesetzgeber 
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verschiedener Lander die Benutzung von Freisprechanlagen 
vorgeschrieben . 



Derartige Freisprechanlagen verfUgen in der Regel tiber eine 
5 sogenannte Pegelwaage, um Rttckkopplungen zwischen Mikrofon 
und Lautsprecher zu vermeiden. Diese Pegelwaagen kttnnen bei 
auf tretenden Nebengerauschen Schwankungen des 
Lautstarkepegels hervorrufen, was in der zwischenmenschlichen 
Kommunikation zwar wenig ins Gewicht failt, jedoch bei einer 
10 Spracherkennung die Spracherkennungsrate der jeweiligen 
Sprachdienste extrem verschlechtert . Folglich sind 
insbesondere derartige Sprachdienste nicht mehr Oder nur noch 
eingeschrSnkt nutzbar. 

15 im Gegensatz zu mobilen Anwendungen existieren far stationare 
Anwendungen im Festnetz sogenannte Freisprechboxen, in denen 
auf einem Hardwaremodul digitale Freisprechalgorithmen 
implementiert sind, die die Nachteile der Pegelwaagen 
vermeiden und eine verbesserte Nutzung insbesondere von 

20 sprachgesteuerten Di ens ten ermfiglichen. 

Eine Aufgabe der Erfindung ist es, einen gegeniiber dem 
vorstehend erwShnten Stand der Technik neuen und wesentlich 
verbesserten Weg auf zuzeigen, mit welchem eine aufierst 
25 flexible Freisprechf unktionalitat fvir 

Telekommunikationsendeinrichtungen insgesamt gewahrleistbar 
ist f insbesondere jedoch fur vorstehend genannte mobile 
Telekommunikationsendeinrichtungen, die in der Regel nur eine 
sehr begrenzte Speicherkapazitat aufweisen. 

30 

Die erf indungsgema&e LOsung der Aufgabe ist auf h5chst 
tiberraschende Weise bereits durch die jeweiligen Gegenstande 
mit den Merkmalen der anhangenden unabhangigen Ansprtiche 
gegeben . 
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Vorteilhafte und/oder bevorzugte Ausftthrungsformen bzw. 
Weiterbildungen sind Gegenstand der jewel ligen anhangenden 
abhangigen Ansprttche. 

5 

Die Erfindung schlagt somit ein Verfahren zum Durchfilhren 
einer Freisprechkommunikation unter Nutzung einer 
Telekommunikationsendeinrichtung, insbesondere einer mobilen 
Telekommunikationsendeinrichtung, vor, bei welcher wenigstens 
10 fur die Dauer einer Kommunikationsverbindung wenigstens ein 
Programm zur Realisierung eines 

Sprachverarbeitungsalgorithmus, insbesondere eines 
Freisprechalgorithmus, von einem Dienstserver temporar oder 
auf Dauer in die Kommunikationseinrichtung geladen und zur 
15 Anwendung implementiert wird. 

Von wesentlichem Vorteil ist somit insbesondere, dass 
aufgrund des lediglich wenigstens temporar geladenen 
Algorithmus eine Sprachverarbeitungsf unktionalitat 

20 insbesondere auch ftir das Freisprechen bei 

Telekommunikationsendeinrichtungen wie einem PDA, MDA oder 
einem Mobiltelefon nutzbar sind, die keine oder nur eine sehr 
geringe Speicherkapazitat , insbesondere auch 
Festspeicherkapazitat, besitzen und ferner, ahnlich einer 

25 Mensch-zu-Mensch-Kommunikation, die ubertragung von 

Sprachsignalen wahrend der Telekommunikationsverbindung 
ermoglicht wird. 

Folglich kann auch ein Sprachdienst, beispielsweise basierend 
30 auf einer serverbasierten Spracherkennung wie bei der ASR, 
unter Freisprechbedingungen bereits unter Ausnutzung der 
vorhandenen Schnittstellen bestehender 

Telekomm\inikationsnetzen genutzt werden, d. h. ohne, wie es 
beispielsweise bei der verteilten Spracherkennung DSR der 
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Fall ist, die Notwendigkeit einer zusatzlichen Vereinbarung 
bzw. standardisierung neuer bzw. weiterer Schnittstellen. 

GemaS einer bevorzugten Weiterbildung der Erf indung ist zur 
5 Verbesserung der Qualitat und/oder zur Verif izierung 
tlbertragener Sprachsignale, insbesondere fttr eine 
nachfolgende Spracherkennung ferner vorgesehen, dass das 
Laden das Laden von wenigstens einem Echokompensations- 
und/oder Gerauschreduktionsalgorithmus von dem Dienstserver 
10 umfasst. Ist zusatzlich oder alternativ wenigstens ein 
Sprach- und/oder Sprecherverif izierungs- (voice 
verification), -erkennungs- , und/oder 

-klassifizierungsalgorithmus von dem Dienstserver ladbar, ist 
hiertiber ferner appikationsspezif isch ein Nutzer und/oder 

15 eine Sprache verif izierbar, z.B. als bei einem Dienst 

regis triert, erkennbar, z.B. aus einer Gruppe von Personen 
heraus, und/oder klassif izierbar, z.B. als mannlich oder 
weiblich. In weiterer zweckmaSiger AusfOhrung ist ferner 
vorgesehen, dass ein Programm zur Realisierung eines *Text- 

20 To-Speech"-Algorithmus, also zur automatisierten Umsetzung 
von Texten in Sprache ladbar ist. 

Die zu tibertragenden Sprachsignale werden zur Obertragung 
bevorzugt digitalisiert , wobei zusatzlich je nach verwendeter 

25 Telekommxinikationsendeinrichtung eine Codierung der 

Sprachsignale durchfuhrbar ist, beispielsweise basierend auf 
einer nach dem GSM-Standard arbeitenden Endeinrichtung. 
Bevorzugt e Ausfuhrungsf ormen von entsprechend angepassten 
Einrichtungen umfassen somit A/D- und/oder D/A-Wandler und 

30 sind systemapplikationsspezif isch auf die Anwendung von 
insbesondere digitalen Algorithmen ausgebildet. 

Basierend auf dem ggf . temporaren Laden wenigstens eines 
Algorithmus von dem Dienstserver, der zweckmafiigerweise eine 
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vielzahl von Algorithmen zum temporaren Laden gespeichert 
hat, ist zur weiteren Erhohung der Flexibilitat insbesondere 
in Bezug auf die Bereitstel lungs- und Zugrif f skapazitaten 
vorgesehen, dass dieser zentral tiber wenigstens ein 
5 Kommunikationsnetz zugreifbar angeordnet ist. Ober das 
wenigstens eine Kommunikationsnetz, beispielsweise ein 
Funknetz, Festnetz und/oder Internet, sind folglich auf 
einfache Weise im wesentlichen ortsungebunden zwischen einer 
oder einer Vielzahl von Telekommunikationsendeinrichtungen 
10 und dem Dienstserver jeweilige Verbindungen aufbaubar. 

Eine derartige Verbindung kann gemaS einer ersten bevorzugten 
Ausfuhrungsform unmittelbar zwischen dem Dienstserver und 
einer bestimmten Telekommunikationsendeinrichtung aufgebaut 
15 werden, wobei eine derartige Verbindung zum Laden wenigstens 
eines Algorithmus bzw. des Programms zur Realisierung eines 
Algorithmus bevorzugt auf ein automatisches oder 
nutzerdefiniertes Anf or derungs signal durch die 
Telekommunikationsendeinrichtung aufgebaut wird. 

20 

Die Erfindung umfasst darttber hinaus besonders bevorzugte 
Ausftthrungsformen, bei denen ferner eine Verbindung ttber 
wenigstens ein Kommunikationsnetz zwischen der 
Telekommunikationsendeinrichtung und einem serverbasierten 
25 Spracherkennungssystem aufgebaut wird. 

Insbesondere bei derartigen Ausfiihrungsf ormen ist erg&nzend 
oder altemativ vorgesehen, dass der Verbindungsaufbau zum 
ggf . temporaren Laden wenigstens eines Algorithmus zwischen 
30 dem Dienstserver und der Telekommunikationsendeinrichtung 
unter Ansprechen auf ein Anf or derungs signal des 
serverbasierten Spracherkennungs systems erfolgt. 
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Das erf indungsgemafce Verfahren sieht zur aufcerst f lexiblen 
Nutzung ferner vor, dass die Anbindung applikationsspezif isch 
zwischen der Telekommunikationsendeinrichtung und dem 
wenigstens einen Kommunikationsnetz drahtgebunden Oder 
5 drahtlos erfolgt. Die Erfindung ermOglicht somit die 
Anbindung von im Wesentlichen jeder 

Telekommunikationsendeinrichtung und die DurchfUhrung des 
erfindungsgemafcen Verfahren unter Nutzung von im Wesentlichen 
jedem Kommunikationsnetz, insbesondere einem Mobilfunknetz, 

10 beispielsweise GSM- (Global System for Mobile communication) 
oder UMTS (Universal Mobile Telecommunication System) - 
basiert, einem (W) LAN-Net z ( (Wireless) Local Area Network) 
und/oder einem Festnetz, beispielsweise im Fall eines DECT 
(Digital Enhanced Cordless Telecommunication) -Telefons als 

15 Telekommunikationsendeinrichtung. 

Auch die erf indungsgema&e Anordnung eines serverbasierten 
Spracherkennungssystems und/oder des Dienstservers ist 
aufierst flexibel und applikationsspezif isch handhabbar. 
20 Bevorzugt ist insbesondere vorgesehen, die Serversysteme 
unmittelbar in ein Funk- oder Festnetz einzubinden, wobei 
hierbei ferner ein intelligentes Netz umfasst sein kann, so 
dass das oder die Serversysteme beispielsweise in einem 
Vermittlungsknoten angeordnet sind und Zugang zu einer 
25 intelligenten Peripherie aufweisen. In erganzender oder 
alternativer Ausftihrung ist ferner vorgesehen die 
Serversysteme unter Verwendung von WEB- Server n , also im 
Wesentlichen von Rechnem und/oder Software, die in einem 
Netzwerk HTTP (HyperText Transfer Protocol) und den 
30 Internet zugang bereitstellen, mit Verbindungen in das 
Internet auszubilden, wobei in diesem Fall die 
Telekommunikationsendeinrichtungen 
Schnittstelleneinrichtungen zum Bereitstellen von 
Kommunikat ions verbindungen \iber das Internet umfassen. 
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Die Erfindung ermc-glicht somit in besonders zweckmaSiger 
Weise einen Rufaufbau fttr eine jeweilige Verbindung zwischen 
der Telekommunikationsendeinrichtung und dem Dienstserver 
und/oder dem serverbasierten spracherkennungs system und/oder 
zwischen dem Spracherkennungssystem und dem Dienstserver 
unter verwendung von jeweils zugeordneten Kennungen. Die 
Erfindung gewahrleistet folglich in bevorzugter praktischer 
Ausftthrung die Nutzung einer Vielzahl von derartigen, 
insbesondere applikationsspezif isch, je nach verwendeten 
Telekommunikationsnetzen, Servern und/oder 
Telekommunikationsendeinrichtungen unterschiedlichen 
Kennungen vor. Solche Kennungen konnen beispielsweise 
Teilnehmeranschlussnummern und/oder Dienstnummern, IP- 
Adressen, Ruf leitungsidentif ikatoren (CLI, Calling Line 
Identification; ANI, Automatic Number Identification) 
und/oder Mobil telef onen zugewiesene, in einem Heimatregister 
(HLR, Home Location Register) eines jeweils zugeordneten 
Kommunikationsnetzes hinterlegte Kennungsadressen umfassen. 

In weiterer vorteilhaf ter Fortbildung ist dartiber hinaus 
vorgesehen, dass die Telekommunikationsendeinrichtung zur 
mehrkanaligen Verarbeitung von Signalen ausgebildet ist. So 
ist hierdurch zusatzlich gewahrleistbar , dass die Qualitat, 
insbesondere einer Gerauschreduktion, beispielsweise bei 
Anschluss von mehreren Mikrofonen uber einen entsprechenden 
Audio- und/oder Stereoeingang durch die dann grundsatzlich 
mOgliche Ortung der Sprachquelle weiter wesentlich verbessert 
wird. Die mehrkanalige Verarbeitung kann auch auf dem Server 
stattfinden, wobei dann eine mehrkanalige oder virtuell 
mehrkanalige (multiplex) Obertragung zwischen Server und 
Endgerat erforderlich ist. 
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Weist die Telekonimunikationsendeinrichtung wenigstens zwei 
Mikrofonkanale, wie z.B. einen Stereoeingang auf, so ist in 
vorteilhafter Weise ein Freisprechalgorithmus mit 
mehrkanaliger Verarbeitung, insbesondere zur Ortung der 
5 Sprachguelle zur verbesserten Gerauschreduktion in die 
Telekommunikationsendeinrichtung ladbar. Weist die 
Telekommunikationsendeinrichtung zusatzlich wenigstens zwei 
Lautsprecherkanale auf und erfolgt die Signalubertragung 
mehrkanalig oder virtuell mehrkanalig (multiplex) , so ist 
10 bevorzugt ein Stereo- oder Freisprechalgorithmus und/ oder 

eine Stereo- oder mehrkanalige Echokompensation insbesondere 
zur Freisprechubertragung mit raumlicher Wahrnehmung in die 
Telekommunikationsendeinrichtung ladbar . 



15 Eine mehrkanalige tibertragung bietet femer den Vorteil, dass 
beispielsweise zusatzlich zu Sprachdaten weitere spezifische 
Parameter, Vektordaten, Test- und/ oder Abgleichsignale auf 
einfache Weise vibertragbar sind, die ansonsten zusammen mit 
den Sprachdaten in das Monosignal eingebettet, soweit 

20 erforderlich, ubertragen werden mtissen. 

Insbesondere ist mittels derartiger Test- und/oder 
Abgleichsignale eine individuelle Oberprilfung des 
eingesetzten Algorithmus hinsichtlich jeweils aktueller 

25 umgebungsbedingen im Wesentlichen jederzeit durchf xihrbar . So 
ist hierzu bevorzugt eine Vergleichseinheit vorgesehen, die 
ein auf Seiten der Telekommunikationsendeinrichtung iiber 
einen Lautsprecher ausgegebenes Testsignal mit dem daraufhin 
Ober ein Mikrof on der Telekommunikationsendeinrichtung 

30 erhSltliches Empfangs signal vergleicht. 



Je nach spezifischer Applikation erfolgt eine derartige 
Cberprufung unter Ansprechen auf ein von dem serverbasierten 
Spracherkennungs system und/oder dem Dienstserver ubertragenes 
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oder durch ein von der Telekommunikationsendeinrichtung 
generiertes Testsignal. Ferner umfasst die Erfindung 
Ausftthrungsformen, bei denen die eigentliche 
Vergleichsuberprtifung der beiden Signale unmittelbar in der 
5 Telekommunikationsendeinrichtung oder erst nach 
Ruckttbertragung des Empfangssignals zu einem der 
serverbasierten Systeme erfolgt. 

Die Aktualisierung eines Algorithmus bzw. die der jeweils 
10 aktuellen Umgebung entsprechende Anpassung, Adaption oder 
Auswechslung des wenigstens einen eingesetzten Algorithmus 
erfolgt somit unter Ansprechen auf das Oberprttfungsergebnis 
beispielsweise durch neues Laden eines entsprechenden 
Programms von dem Dienstserver oder aber, wenn eine vielzahl 
15 von Algorithmen auf der Telekommunikationsendeinrichtung 
wenigstens temporar geladen sind, durch entsprechendes 
Selektieren des geeigneten Algorithmus durch die 
Telekommunikationsendeinrichtung selbst . 

20 Zur weiteren Steigerung der Spracherkennungsqualitat sowie 
der f lexiblen Nutzung unterschiedlicher Frequenzspektren 
und/oder -bander sieht die Erfindung ferner bevorzugt eine 
Umsetzfunktionalitat far die Sprachsignale zur (Jbertragung 
zwischen mit unterschiedlichen Frequenzen arbeitenden 

25 Kommunikationseinheiten vor, beispielsweise von einer auf 
einer 30 kHz Basis Sprachsignalverarbeitenden 
Telekommunikationsendeinrichtung fur eine auf einer 8 kHz 
Basis bereitgestellten Kommunikationsverbindung eines 
verwendeten Kommunikationsnetzes mit gegebenenf alls 

30 anschlieSender erneuten Umsetzung auf 30 kHz durch eine der 
serverbasierten Spracherkennung entsprechend zugeordneten 
Umsetzeinrichtung . 
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In weiterer vorteilhaf ter Ausbildung schlagt die Erf indung 
ferner vor, dass von der Telekommunikationsendeinrichtung 
spezifische Kennungsparameter und/oder Tariff ierungsparameter 
zur Weiterbearbeitung ubertragen und von einer dem 
5 spracherkennungs system und/oder dem Dienstserver zugeordneten 
Vorrichtung erf ass t werden. 

So ist insbesondere bei Zuordnung derartiger 
Kennungsparameter auf dem Dienstserver und/oder dem Server 

10 des Spracherkennungs systems zu fur die entsprechende 
Telekommunikationsendeinrichtung besonders geeigneten 
Algorithmen bereits bei Neu- und/oder wiederholter Anmeldung 
einer Telekommunikationsendeinrichtung bei einem der 
Serversysteme anhand derartig ubertragener Parameter eine 

15 vorteilhafte, insbesondere zeitsparende Vorauswahl von 
geeigneten temporar zu ladenden Algorithmen moglich. 

Mittels applikationsspezifischer Tariff ierungsparameter ist 
ferner, ggf . in Verbindung mit dem Kennungsparametern, eine 

20 der Telekommunikationsendeinrichtung und/oder dem Nutzer der 
Telekommunikationsendeinrichtung zugeordnete vorzugsweise 
automatische Entgeldabrechnung und/oder -belastung von 
kostenpflichtig bereitgestellten Diensten und/oder 
Algorithmen mit im Wesentlichen alien an und fur sich hierfur 

25 bekannten Abrechnungs- und/oder Belastungsverf ahren auf eine 
sehr einfache Weise gegeben. 

Die Erf indung sieht ferner in praktischer Weiterbildung vor, 
dass vor oder wahrend der Anwendung eines temporar 
30 implementierten Algorithmus die Kalibrierung einer auf Seiten 
der Telekommunikationsendeinrichtung durchzuftthrenden Analog- 
Digital- und/oder Digital-Analogwandlung erfolgt. Eine solche 
Kalibrierung kann einmalig fur eine Kommunikationsverbindung 
Oder kontinuierlich durchgefuhrt werden. Insbesondere far die 
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flexible umgebungsbasierte Anwendung oder Auswahl 
entsprechend angepasster Algorithmen aus einer gemeinsamen 
Gruppe, oder eines gemeinsamen Anbieters ist ferner eine 
digitale Kalibrierung, insbesondere unter verwendung eines 
einen jeweiligen Algorithmus ausfilhrenden Prozessors der 
Telekommunikationsendeinrichtung von Vorteil. 

Als Abgleichsignal fur die folglich im Wesentlichen 
universell einsetzbare Kalibrierung ist ferner vorgesehen, 
das Sprachsignal selbst und/oder entsprechend ausgebildete 
Testsignale, beispielsweise ein in Sprechpausen uber den 
Lautsprecher der Telekommunikationsendeinrichtung 
ausgesandtes und das uber das Mikrofon der 

Telekommunikationsendeinrichtung ruckempf angene Rauschsignal , 
zu verwenden. 

Daruber hinaus umfasst die Erfindung folglich insbesondere 
gemafe den anhangenden Anspruchen ein zur Durchfuhrung des 
erf indungsgemaften verfahrens entsprechend ausgebildetes 
0 System, welches in deren einzelnen Ausfuhrungsf ormen mit, zu 
vorstehend aufgefuhrten Vorteilen gleichen und/oder 
vergleichbaren Vorteilen belegt ist. 

Weitergehende Vorteile und Charakteristika der Erfindung 
5 werden anhand der nachf olgenden detaillierteren Beschreibung 
bevorzugte jedoch lediglich beispielhaf te erf indungsgemafie 
Ausfuhrungsf ormen unter Bezugnahme auf die beigeftigten 
Zeichnungen ersichtlich. 

30 In den Zeichnungen zeigen: 

Fig. 1 eine stark vereinfachte schematische 

Prinzipdarstellung eines erf indungsgemaSen Systems 

und 
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Fig. 2 ein vereinf achtes Blockschaltbild zur 
Veranschauli chung eines lokalen 
verarbeitungsprinzips fur die erf indungsgemaSe 
Freisprechfunktionalitat auf einer mobilen 
Telekonvmunikationsendeinrichtung gemaS der 
Erf indung. 

Nachfolgend werden anhand der Figuren 1 und 2, welche eine 
schematische Darstellung eines erf indungsgema&en 
Freisprechsys terns bzw. eine Blockdarstellung zur 
Veranschauli chung eines lokalen erf indungsgemaSen 
Verarbeitungsprinzip fur die Anwendung einer 
Freisprechfunktionalitat auf einer mobilen 
Telekommunikationsendeinrichtung zeigen, bevorzugte 
Ausfuhrungsformen der Erf indung, beispielhaft beschrieben. 

In Figur 1 ist eine mobile Telekommunikationsendeinrichtung 
100 dargestellt, die tiber eine Luftschnitts telle, z.B. 
mittels Funk, wie mit dem Doppelpfeil 1 angedeutet, Zugang zu 
einem Telekommunikationsnetz 200 hat. Wie mit dem Doppelpfeil 
angezeigt, wird uber die Luf tschnittstelle eine Duplex- 
Kommunikation in zweckmafiiger Weise eine Vollduplex- 
Kommunikation bereitgestellt . Die mobile 
Telekommunikationsendeinrichtung 100 ist im vorliegenden 
betrachteten Fall ein Mobiltelef on, ein PDA oder auch ein 
MDA, welches auf einem GSM-Standard basierend tiber ein somit 
im vorliegenden Fall vom Telekommunikationsnetz 200 umfasstes 
Mobilfunknetz kommunizieren und also Sprachdaten entsprechend 
einer Mensch-zu-Mensch-Kommunikation uber das Netz 200 
ubermitteln kann. 

Es sei jedoch darauf hingewiesen, dass das Mobilfunknetz und 
die diesem zugeordnete Telekommunikationsendeinrichtung 100 
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auch auf einem anderen Standard, beispielsweise einem UMTS- 
Standard, basieren kann. Ferner sei fttr die nachfolgende 
Beschreibung und die anhangenden Ansprttche darauf 
hingewiesen, dass der verwendete Begriff 
Telekommunikationsnetz allgemein ein einziges 
Kommunikationsnetz oder eine Mehrzahl von 

Kommunikationsnetzen, einschliefclich Sprach/Daten Netze und 
Daten/Daten Netze, umfassen kann. 

t)ber wenigstens eine weitere, mit dem Doppelpfeil 2 
gekennzeichnete Schnittstelle ist ein sprachgesteuerter CT- 
Server (Computer-Telef onie Server) mit Algorithmen zur 
Spracherkennung 300 dauerhaft oder bei Bedarf mit dem zur 
ubertragung von Sprachdaten geeigneten Telekommunikationsnetz 
200 direkt uber das Mobilf unknetz oder uber weitere, nicht 
dargestellte Kommunikationsnetze verbunden. 

Ferner besteht eine dauerhafte oder bei Bedarf aufbaubare 
Verbindung 3 zu einem Dienstserver 400, der eine Vielzahl von 
digitalen Freisprechalgorithmen und ggf . weitere Audiosignale 
vorverarbeitende Algorithmen wie insbesondere 
Echokompensations- und/oder Gerauschreduktionsalgorithmen 
beinhaltet . 

Ferner umfasst die dargestellte Systemanordnung einen dritten 
Server 500, welcher Teil eines Tariff ierungs- bzw. 
Kostenentgelterfassungs- und -belastungssys terns, also im 
Wesentlichen eines sogenannten Billing Systems oder Billing 
Support Systems (BSS) ist, zu welchem im vorliegenden 
betrachteten Fall eine Simplex-Verbindung 4 uber das 
Telekommunikationsnetz 200 aufbaubar ist. 

In bevorzugter Weise umfassen die Server 300, 400 und 500 zur 
Kommunikation und/oder zum Datenaustausch untereinander 
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direkte verbindungen 5, 6, so dass in altemativer Ausftlhrung 
beispielsweise lediglich die Verbindung 2 von den Servern 
300, 400 und 500 zum Telekoinmunikationsnetz 200 zur 
Durchftthrung des nachfolgend detailliert beschriebenen 
5 erfindungsgemafcen Verfahrens notwendig ist. In weiterer 

altemativer Ausftlhrung kann auch vorgesehen sein, dass die 
Server 300, 400 und 500 Teil einer gemeinsamen 
Servervorrichtung sind. 

Sind die Server 300, 400 und 500 gemafc einer bevorzugten 
Ausbildung beispielsweise als WEB-Server ausgebildet, wird 
mit der darges tell ten Systemanordnung fur die mobile 
Telekommunikationsendeinrichtung 100 ttber das 
Telekommunikationsnetz 200 zumindest jeweils ein Programm zur 
Realisierung eines Freisprechalgorithmus aus dem internet 
ladbar vom den Dienstserver 400 zur Verfvigung gestellt und 
zur Nutzung eines vom Server 300 bereitges tell ten 
Sprachdienstes auf die mobile 

Telekommunikationsendeinrichtung 100 temporar geladen und 
implementiert . Da zum temporaren Laden im Allgemeinem bereits 
ein Arbeitsspeicher ausreichend ist, benotigt die mobile 
Telekommunikationsendeinrichtung 100 in diesem Fall somit im 
Wesentlichen keine Festplattenspeicherkapazitat , welche 
jedoch in speziellen Anwendungsf ormen noch verwendet werden 
kann. 

Je nach aktuell bestehender Umgebungsbedingung, 
beispielsweise bei Nutzung der mobilen 

Tel ekommunikat ions endeinrichtung 100 in einem bestimmten 
30 Fahrzeug, welches eine andere Gerauschumgebung darstellt, als 
die Nutzung der mobilen Telekommunikationsendeinrichtung 100 
im Freien oder in einem anders konzipierten Fahrzeug, kann 
somit auch bei einer aufierst begrenzten Speicherkapazitat von 
der Vielzahl von im Dienstserver 400 auf einem Massenspeicher 
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bereitges tell ten Algorithmen jeweils ein entsprechend 
geeigneter Algorithmus temporar auf die 
Telekommunikationsendeinrichtung 100 geladen und 
implementiert werden. Nach erfolgter spezifischer Nutzung 
wird der Speicherplatz wieder anderen Anwendungen zur 
Verfttgung gestellt. 

Je nach entspr echender , insbesondere applikationsspezif ischer 
Ausbildung erfolgt die Obertragung des wenigstens einen 
Algorithmus beispielsweise bei Erstanruf des Servers 3 00 
und/ oder 400, basierend auf einem entsprechenden 
Dienstabonnement oder auch durch direkte Anforderung durch 
den Nutzer der mobilen Telekommunikationsendeinrichtung 100. 

Bei der anschlieSenden Kommunikation zwischen der mobilen 
Telekommunikationsendeinrichtung 100 und dem 
Spracherkennungssystem 200 und/oder auch bei Aufbau einer 
Kommunikationsverbindung zu einer anderen 
Telekommunikationsendeinrichtung werden folglich keine 
Merkmalsvektoren wie bei einer verteilten Spracherkennung , 
also wie bei DSR notwendig, sondern ttbliche, im betrachteten 
Beispiel GSM-kodierte Sprachdaten ubertragen. 

Wie aus Figur 2 zu sehen ist, weist die mobile 
Telekommunikationsendeinrichtung 100 in bevorzugter 
Ausbildung eine Sende- und Empfangseinheit 101, eine 
Kodiereinrichtung 102 sowie eine mit dem temporaren Speicher 
verbundene Prozessoreinheit 103 auf, uber welche ein auf den 
Speicher temporar geladener Algorithmus ausfiihrbar ist. Die 
Prozessoreinheit 103 ist mit einem Digital-Analog-Wandler 10! 
verbunden, der mit einem internen Lautsprecher 108 verbunden 
ist, oder erganzend oder alternativ beispielsweise uber eine 
infrarot- oder Bluetooth-Schnittstelle oder auch uber eine 
drahtgebundene Schnittstelle zu einem extemen Lautsprecher 



WO 2005/01 1235 PCT/DE2004/001253 

17 

110 verbindbar ist. Von einem internen Mikrofon 107 oder in 
entsprechender Weise ttber eine Schnittstelle von einem 
externen Mikrofon 109 besteht eine Verbindung zu der 
Prozessoreinheit 103 ttber einen zwischengeschalteten 
5 Analog-Digital-Wandler 104. Ferner ist eine durch die 

Prozessoreinheit 103 kontrollierbare Kalibriersteuereinheit 
106 zur Kalibrierung der Wandler 105 und 104 vorgesehen. 
ZweckmaSiger Weise stellen die Wandler 104 und 105 oder eine 
zugeordnete Einheit zusatzlich eine insbesondere einstellbare 
10 signalverstarkung bereit. 

Eine Kalibrierung der Wandler 104 und 105 wird je nach 
spezifischer Ausbildung einmalig bei jeder Inbetriebnahme der 
Telekommunikationsendeinrichtung 100 durchgeftthrt oder, 
15 beispielsweise kontinuierlich oder zeitbasiert ttberwacht, 
wahrend des Betriebs. 

Auch eine digitale Kalibrierung, beispielsweise basierend auf 
dem an der Prozessoreinheit 103 vorliegenden Signal, welches 

20 dem Wandler 105 zugeftthrt bzw. von dem Wandler 104 empfangen 
wird, ist durchf tthrbar . Eine derartige Kalibrierung wird 
bevorzugt speziell auf eine bestimmte Gruppe von temporar 
ladbaren Algorithmen, insbesondere unter Verwendung eines 
entsprechenden Zuordnungs- und/ oder -verknttpfungsschemata, 

25 abgestimmt. 

GemSS der Ausbildung gemaS Fig. 2 werden somit ttber das 
Telekommunikationsnetz 200 von dem 
Spracherkennungssys terns erver 300 zur mobilen 
30 Telekommunikationsendeinrichtung 100 ttbertragene digitale 

Sprachsignale vor Ausgabe auf den Lautsprecher 108 oder 110 
dem von der Prozessoreinheit 103 aktivierten 
Freisprechalgorithmus digitalisiert zur Verarbeitung 
zugeleitet und anschlieSend ttber den Digital -Analog-Wandler 
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105 dem Lautsprecher 108 und/oder 110 zugeleitet. 
Entsprechend wird ein uber das Mikrofon 107 und/oder 109 
empfangenes Sprachsignal nach einer Digital- Analog- Wandlung 
durch den Wandler 104 bei ggf . entsprechend angepasster 
Verstarkung der Prozessoreinheit 103 zugefuhrt und durch den 
aktivierten Freisprechalgorithmus verarbeitet, bevor es uber 
das Telekommunikationsnetz 200 weitergeleitet wird. 

Folglich ermoglicht die Erfindung ohne zusatzliche 
Vereinbarung oder standardisierung neuer Schnittstellen im 
Obertragungsnetz 200, wie dies ansonsten bei der DSR 
notwendig ist, unter Ausnutzung der vorhandenen 
Schnittstellen bereits unter gegenwartigen Bedingungen die 
Nutzung von Sprachdiensten unter Freisprechbedingungen, also 
insbesondere auch innerhalb eines Fahrzeuges. 

Da, wie vorstehend erwahnt, auf dem Dienstserver 400 
bevorzugt zusatzlich weitere Algorithmen zum wenigstens 
temporaren Laden bereitgestellt sind, werden in auSerst 
0 bevorzugter Weiterbildung zusatzlich zu dem wenigstens einen 
Freisprechalgorithmus beispielsweise auch 

Gerauschreduktionsalgorithmen auf entsprechende Weise auf die 
Telekommunikationsendeinrichtung 100 zur Ausfuhrung durch die 
Prozessoreinheit 103 temporar geladen. 

!5 

Werden beispielsweise die letztgenannten Algorithmen auf der 
mobilen Telekommunikationsendeinrichtung 100 im Fahrzeug 
ausgeftihrt, so besteht, wenn die mobile 
Telekommunikationsendeinrichtung den Anschluss mehrerer 
SO Mikrofone, z. B. uber einen Stereoeingang, bietet, zusatzlich 
die Moglichkeit, die Qualitat der Gerauschreduktion durch die 
dann im Prinzip mSgliche Ortung der Sprachquelle, also des 
Sprechers bzw. des Nutzers der mobilen 

Telekommunikationsendeinrichtung 100 nochmals entscheidend zu 
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verbessern. Bei Durchftthrung eines 
Gerauschreduktionsalgorithmus unmittelbar auf dem 
Spracherkennungssys terns erver 300 hingegen steht im 
Allgemeinen nur ein Monosignal zur verfilgung, welches zwar 
5 eine Gerauschreduktion, jedoch im Allgemeinen keine Ortung 
ermoglicht . 

FUr die Dauer der Nutzung des uber den Server 300 
bereitgestellten Spracherkennungsdienstes und/oder fur die 

10 Nutzung eines Algorithmus von dem Dienstserver 400 werden 

bevorzugt Tarif f ierungs- und/oder Kennungsparameter von der 
Telekommunikationsendeinrichtung 100, dem Server 300 und/oder 
dem Dienstserver 400 zu dem Tarif f ierungs server 500 
ubertragen, mittels welcher der Dienst abrechenbar ist f wobei 

15 zur Abrechnung und/oder Kontenbelastung im wesentlichen alle 
bekannten Oder auch noch in der Zukunft zu entwickelnden 
Verfahren anwendbar sind. 

Eine Oberprufung des oder der mittels der Prozessoreinheit 
20 103 durchgefuhrten Algorithmen auf deren aktuelle Eignung 

wird bevorzugt uber ein Abgleichsignal durchgef Ohr t , welches 
beispielsweise in Sprachpausen in einem Rauschsignal verpackt 
uber den Lautsprecher 108 oder 110 ausgegeben, uber das 
Mikrofon 107 und/oder 109 wieder als Antwortsignal empfangen 
25 und mit dem ausgegebenen Signal verglichen wird. 

Ein derartiges Test- oder Abgleichsignal kann bei 
Bereitstellung eines entsprechenden, nicht dargestellten 
Signalgenerators durch die mobile 
30 Telekommunikationsendeinrichtung selbststSndig erzeugt 

werden, insbesondere wenn mehrere zur Aktivierung auswahlbare 
Algorithmen temporar auf die mobile 

Telekommunikationsendeinrichtung 100 geladen sind. Derartige 
Test- oder Abgleichsignale kSnnen jedoch auch durch den 
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Server 300 una/oder 400 zur mobilen 

Telekommunikationsendeinrichtung 100 ubertragen und nach 
Empfang des An twort signals mit diesem auf dem Server Oder 
einer entsprechend zugeordneten Oberpriifungseinheit auf die 
Tauglichkeit des aktuell aktivierten Algorithmus hin 
verglichen werden, so dass ggf . ein entsprechend angepasster 
aktualisierter Algorithmus von dem Dienstserver 400 auf die 
mobile Telekommunikationsendeinrichtung 100 ubertragen und 
dort temporar geladen wird. 



Ein derartiges Abgleich- oder Testsignal wird bei 
einkanaliger Ausfilhrung der mobilen 
Telekommunikationsendeinrichtung 100 bevorzugt als 
Rauschsignal in das Sprachsignal eingebettet und kann bei 
15 zweikanaliger Ausfuhrung der mobilen 

Telekommunikationsendeinrichtung 100 beispielsweise uber den 
zus&tzlichen Kanal ubertragen werden. 

Ferner ist erf indungsgemaS vorgesehen, bei einer 

20 zweikanaligen Ausbildung der mobilen 

Telekommunikationsendeinrichtung 100 uber den zusatzlichen 
Kanal, also im Wesentlichen unabhangig von den Sprachdaten 
jedoch ggf. in AbhSngigkeit des jeweils verwendeten 
Algorithmus zusatzliche Parameter, wie z.B. die vorstehenden 

25 Kennungsparameter, weitere Daten und/oder ggf. auch 

Merkmalsvektoren zu ubertragen, sofem das verwendete 
Telekommunikationsnetz 200 bzw. die Schnittstellen 1 und 2 
hierzu entsprechend ausgebildet sind. 



30 Die Erfindung umfasst ferner Ausfuhrungsf ormen, bei denen d: 
Schnittstellen 1 und 2 zu dem Frequenzband der mobilen 
Telekommunikationsendeinrichtung 100 unterschiedliche 
FrequenzbSnder aufweisen. Basiert z. B. die 
Signalverarbeitung der Telekommunikationsendeinrichtung 100 
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auf einem 30kHz Band, weist die 

Telekommunikationsendeinrichtung 100 vorzugsweise eine 
Umsetzeinrichtung auf, um das 30kHz-umfassende Sprachsignal 
zur Obertragung an den sprachgesteuerten CT-Server 300 
5 beispielsweise auf ein 8kHz-umfassendes Sprachsignal 
umzusetzen. Die so empfangenen Signale werden 
applikationsspezifisch ggf . vor der Spracherkennung von einer 
dem CT-Server 300 zugeordneten Umsetzeinheit wiederum auf das 
ursprungliche 30kHz-umf assende Signal ruckgesetzt. Zur 
10 Erkennung derartiger, ggf. umzusetzender Signale werden z.B. 
vorstehende, zusatzlich ttbertragene Daten oder Parameter 
verwendet . 

Von der Erfindung sind ferner Ausftthrungsformen umfasst, bei 
15 denen anband von die Telekommunikationsendeinrichtung 100 
spezifizierenden Kennungsparametem, die bei Ruf des 
Spracherkennungsservers 300 durch die 

Telekommunikationsendeinrichtung 100 mit tibertragen und/oder 
angef order t werden, eine Vorauswahl von zu ubertragenen 
20 Algorithmen getroffen wird. Derartige vorselektierte 
Algorithmen konnen hierbei fur die spezif izierte 
Telekommunikationsendeinrichtung 100 voreingestellt sein oder 
z.B. sich in der Vergangenheit als geeignete Algorithmen 
erwiesen haben, beispielsweise basierend auf einer in Bezug 

25 auf die Telekommunikationsendeinrichtung 100 in der 
Vergangenheit festges tell ten Umgebungsbedingung . Der 
Dienstserver 400 wird in Folge beispielsweise uber die 
Verbindung 5 entsprechend zur Obertragung des ausgewahlten 
bzw. voreinges tell ten Algorithmus angewiesen. In 

30 entsprechender Weise ist jedoch auch eine Vorauswahl unter 
Umgehung des Spracherkennungsservers 300, also uber die 
Schnittstellen 1 und 3 gemaS Figur 1 mSglich. 
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Derartige Kennungsparameter sind applikationsspezif isch 
variabel und konnen beispielsweise je nach verwendeter 
Telekommunikationsendeinrichtung eine IP-Adresse, eine CLI- 
und/oder aus einem der Telekommunikationsendeinrichtung 100 
5 zugeordneten HLR von dem Server 300 abgefragte Parameter 
umfassen. 

Darttber hinaus ist es fur die Erfindung nicht zwingend, dass 
die Telekommunikationsendeinrichtung 100 mobil ausgebildet 

10 ist. Grundsatzlich kann fur die Erfindung auch eine 

stationare oder eine in einem Fahrzeug fest integrierte 
Telekommunikationsendeinrichtung sein, die je nach zugrunde 
gelegtem System z.B. auch mit einer DECT-, einer Bluetooth-, 
einer (W) LAN oder anderen, auch drahtgebundenen Schnittstelle 

15 far den Zugang zu einem entsprechenden Netz ausgebildet ist. 

Das insgesamt verwendete Telekommunikationsnetz 200 kann 
somit applikationsspezifisch unterschiedlich sein und 
beispielsweise Mobil funknetze, (W) LAN, Festnetze und/ oder das 
20 Internet umfassen. 

Auch kann das verwendete Telekommunikationsnetz ein 
intelligentes Netz umfassen, wobei zumindest der 
Spracherkennungssys terns erver 300 hierbei bevorzugt in einem 
25 Dienstknoten angeordnet ist und in zweckmaGiger Weise Zugang 
zu einer intelligenten Peripherie besitzt. 

GemSS weiteren bevorzugten Ausfuhrungsf ormen ist femer 
vorgesehen, dass der Dienstserver 400 beispielsweise auch 
30 direkt, unter Umgehung des Telekommunikationsnetzes 200, mit 
der Telekommunikationsendeinrichtung 100 zum Bereitstellen 
von Algorithmen ausgebildet ist. So ist beispielsweise 
insbesondere vorgesehen, dass der Dienstserver 400 Teil einer 
intelligenten, beispielsweise in einem Fahrzeug 
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untergebrachten Einheit ist, auf der eine Vielzahl von 
Algorithmen zur Verfttgung stehen und beispielsweise von einer 
zentralen, in Figur 1 nicht dargestellten Servereinheit mit 
aktuellen Algorithmen entsprechend ttber das 
5 Telekommunikationsnetz versorgt wird. Von einem solchen 

angeordneten Dienstserver kann folglich auch mittels einer 
direkten Verbindung zur Telekommunikationsendeinrichtung 100 
ein entsprechend geeigneter Algorithmus auf die 
Telekommunikationsendeinrichtung 100 temporar geladen werden. 

10 

Mittels entsprechend den einzelnen Systemkomponenten 100, 
300, 400 und/ Oder ggf . 500 zugewiesenen Rufkennungen konnen 
somit im Wesentlichen ortsunabhangig und bei 

applikationsspezifisch gewahlter oder vorliegender Anordnung 
15 entsprechende gewunschte oder auch notwendige 

Kommunikationsverbindungen zwischen den einzelnen 
Einrichtungen und/oder Systeme zur Durchfiihrung des 
erfindungsgemaSen Verfahrens aufgebaut werden. 

20 Solche Kennungen umfassen somit insbesondere 

Teilnehmeranschlussnummern und/oder Dienstnummern, IP- 
Adressen, Ruf leitungsidentif ikatoren und/oder Mobiltelefonen 
zugewiesene, in einem Heimatregister eines jeweils 
zugeordneten Kommunikationsnetzes hinterlegte 

2 5 Kennungs adr es s en . 

Eine fest installierte Sprachverarbeitungsfunktionalitat, 
insbesondere Freisprech- und/oder Gerauschreduktions- oder 
Spracherkennungsfunktionalitat, auf einer 
30 Telekommunikationsendeinrichtung 100 ist somit durch die 
Erfindung nicht mehr notwendig, so dass die Erfindung 
insbesondere bei Telekommunikationsendeinrichtungen Anwendung 
findet, die keinen oder nur einen sehr geringen Speicher 
besitzen, keine ausreichende Kapazitat auf diesem mehr 
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bereithalten Oder aber diese Kapazitat anderweitig genutzt 
werden soil. 

So kann beispielsweise auf der 
5 Telekonununikationsendeinrichtung 100 voreingestellt sein, 
dass bei Aufbau einer Konununikationsverbindung automatisch 
zunachst eine Verbindung zu dem Dienstserver 400 aufgebaut 
wird zum temporaren Laden und Implementieren eines oder ggf . 
auch mehrerer Algorithmen auf die 
10 Telekommunikationsendeinrichtung 100, aus denen anschliefiend 
durch die Telekommunikationsendeinrichtung 100 der jeweils 
geeignete entsprechend auswahlbar ist. 

Erweist sich ein implementierter Algorithmus als nicht mehr 
15 geeignet und/oder nach Beendigung der gewttnschten 

Konununikationsverbindung, wird die durch den Algorithmus 
belegte Speicherkapazitat, beispielsweise des 
Arbeitsspeichers, wieder fiir andere Anwendungen freigegeben. 



WO 2005/011235 



25 



PCT/DE2004/00125J 



Patentansprtiche 

1. verfahren zum Durchftihren einer Freisprechkommunikation 
5 unter Nutzung einer Telekommunikationsendeinrichtung 

(100), insbesondere einer mobilen 
Telekonmunikationsendeinrichtung (100), dadurch 
gekennzeichnet, dass wenigstens far die Dauer einer 
Koramunikationsverbindung wenigstens ein Programm zur 
10. Realisierung eines Sprachverarbeitungsalgorithmus von 

einem Dienstserver (400) wenigstens temporSr in die 
Telekommunikationsendeinrichtung (100) geladen und zur 
Anwendung implementiert wird. 

15 2. Verfahren nach Anspruch 1, ferner gekennzeichnet durch 

das wenigstens tempor&re Laden wenigstens eines 
Freisprech- , Echokompensations- , 
Sprecherverif izierungs- , -erkennnngs- , 
-klassifizi er ungs - , Sprachver i f i z i erungs - , 

20 -erkennungs-, *Text-To-Speech"- und/oder 

Gerauschreduktionsalgorithmus von dem Dienstserver. 

3. verfahren nach einem der vorstehenden Anspriiche, ferner 
dadurch gekennzeichnet, dass Sprachsignale zur 

25 tibertragung digitalisiert und/oder codiert werden. 

4. verfahren nach einem der vorstehenden Anspriiche, ferner 
gekennzeichnet durch das Aufbauen einer Verbindung tiber 
wenigstens ein Kommunikationsnetz zwischen der 

30 Telekommunikationsendeinrichtung (100) und einem 

Serverbasierten Spracherkennungs system (300) . 



5. Verfahren nach einem der vorstehenden Anspriiche, ferner 
dadurch gekennzeichnet, dass auf dem Dienstserver (400) 
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eine Vielzahl von Algorithmen zum temporaren Laden 
gespeichert werden. 

6. verfahren nach einem der vorstehenden Ansprttche, ferner 
5 dadurch gekennzeichnet, dass zum Laden des wenigstens 

einen Algorithmus eine Verbindung zu dem Dienstserver 
(400) ttber wenigstens ein Kommunikationsnetz aufgebaut 
wird. 

10 7. verfahren nach einem der vorstehenden Ansprttche, ferner 
dadurch gekennzeichnet, dass die Verbindung zum Laden 
unmittelbar zwischen dem Dienstserver (400) und der 
Telekommunikationsendeinrichtung (100) aufgebaut wird 
oder uber die Zwischenschaltung eines serverbasierten 

15 Spracherkennungs systems (300) . 

8. Verfahren nach einem der vorstehenden Ansprttche, ferner 
dadurch gekennzeichnet, dass die Verbindung zum Laden 
zwischen dem Dienstserver und der 

20 Telekommunikationsendeinrichtung (100) unter Ansprechen 

auf ein automatisches oder nutzerdef iniertes 
Anforderungssignal durch die 

Telekommunikationsendeinrichtung (100) oder unter 
Ansprechen auf ein Anforderungssignal eines 
25 serverbasierten Spracherkennungs system (300) erfolgt. 

9. Verfahren nach einem der vorstehenden Ansprttche, ferner 
dadurch gekennzeichnet, dass ein Verbindungsaufbau 
zwischen der Telekommunikationsendeinrichtung (100) und 

30 dem Dienstserver (400) und/oder einem Serverbasierten 

Spracherkennungs system (300) unter Verwendung von 
jeweils zugeordneten Kennungen, beispielsweise mittels 
CLI, ANI oder HLR, erfolgt. 
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10. Verfahren nach einem der vorstehenden Ansprtlche, ferner 
dadurch gekennzeichnet, dass die Aribindung zwischen der 
Telekoiranunikationsendeinrichtung (100) und dem 
wenigstens einen Kommunikationsnetz drahtgebunden oder 
drahtlos erfolgt. 

11. Verfahren nach einem der vorstehenden Ansprtlche, ferner 
dadurch gekennzeichnet, dass die Obertragung von der 
Telekommunikationsendeinrichtung (100) ein- oder 
mehrkanalig durchgefuhrt wird. 

12. Verfahren nach einem der vorstehenden Anspriiche, ferner 
dadurch gekennzeichnet, dass zusatzlich zu 
Sprachsignalen weitere Signale, insbesondere Test- 
und/oder Abgleichsignale, Tarif fierungs- und/oder 
Kennungsparameter und/oder Vektoren umfassende Signale 
ubertragen werden. 

13. verfahren nach einem der vorstehenden Ansprtlche, ferner 
dadurch gekennzeichnet, dass zur Obertragung von 
Sprachsignalen eine Umsetzung zwischen 
unterschiedlichen Frequenzbandern und/oder -spektren 
durchgefiihrt wird. 

14. Verfahren nach einem der vorstehenden Anspriiche, ferner 
dadurch gekennzeichnet, dass die Auswahl eines aktuell 
anzuwendenden Algorithmus von der 
Telekommunikationsendeinrichtung (100), einem 
Spracherkennungs system (300) oder dem Dienstserver 
(400) durchgefuhrt wird. 

15. Verfahren nach einem der vorstehenden Anspriiche, ferner 
dadurch gekennzeichnet, dass zur tiberprufung eines 
aktuell angewendeten oder anzuwendenden Algorithmus ein 
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Testsignal auf Seiten der 

Telekommunikationsendeinrichtung (100) ausgeben und mit 
dem wieder empfangenen Antwortsignal verglichen wird. 



5 16. Verfahren nach einem der vorstehenden Anspruche, ferner 

dadurch gekennzeichnet, dass fur die Dauer der 
Kommunikationsverbindung das Laden wenigstens eines 
Algorithmus einmalig erfolgt oder mehrmalig, 
insbesondere aktualisierend erfolgt. 

10 

17. verfahren nach einem der vorstehenden Anspruche, ferner 
dadurch gekennzeichnet, dass von der 
Telekommunikationsendeinrichtung (100) spezifische 
Kennungsparameter und/oder Tariff ierungsparameter zur 

15 weiterbearbeitung durch eine einem 

Spracherkennungssystem (300) und/oder dem Dienstserver 
(400) zugeordnete Vorrichtung ubertragen werden. 

18. Verfahren nach einem der vorstehenden Anspruche, ferner 
20 dadurch gekennzeichnet, dass von der 

Telekommunikationsendeinrichtung (100) eine 
Kalibrierung einer A/D und/oder D/A- Wandlung (104, 
105) durchgefuhrt wird. 

25 19. Verfahren nach vorstehendem Anspruch, ferner dadurch 

gekennzeichnet, dass die Kalibrierung einmalig fur eine 
Kommunikationsverbindung, kontinuierlich und/oder 
digital durchgefuhrt wird. 

30 20. Verfahren nach einem der beiden vorstehenden Anspruche, 

ferner dadurch gekennzeichnet, dass als Abgleichsignal 
fur die Kalibrierung das Sprachsignal und/oder ein 
Testsignal verwendet wird. 



WO 2005/01 1 235 PCT/DE2004/00 1 253 

29 

21. verfahren nach einem der beiden vorstehenden Anspruche, 
ferner dadurch gekennzeichnet, dass, insbesondere bei 
mehrkanaliger Verarbeitung von wenigstens zwei 
Mikrofonsignalen und/oder zur Gerauschreduktion, eine 
5 Ortung der Sprachquelle durchgeftthrt wird. 



22. System zum Bereitstellen einer Freisprechkommunikation 
fttr wenigstens eine Telekommunikationsendeinrichtung 
(100) , insbesondere eine mobilen 
10 Telekommunikationsendeinrichtung, insbesondere zur 

Durchftthrung des Verfahrens nach einem der vorstehenden 
Anspruche, umfassend einen Dienstserver (400) mit 
Mitteln zum Bereitstellen von wenigstens einem 
Sprachverarbeitungsalgorithmus, wobei der Dienstserver 

15 ausgebildet ist, unter Ansprechen auf ein definiertes 

Anforderungs signal wenigstens ein Programm zur 
Realisierung eines Sprachverarbeitungsalgorithmus zur 
wenigstens temporaren Anwendungsimplementierung an 
wenigstens eine bestimmte der wenigstens einen 

20 Telekommunikationsendeinrichtung (100) zu Obertragen. 

23. System nach einem der vorstehenden Anspruche, ferner 
dadurch gekennzeichnet, dass der Dienstserver (400) 
Mittel zum Bereitstellen von wenigstens einem 

25 Freisprech-, Echokompensations-, 

Sprecherverif izierungs- , -erkennungs- , 
-klassif izierungs- , Sprachverif izierungs- , 
-erkennungs-, n Text-To-Speech"- und/oder 
Gerauschreduktionsalgorithmus zur wenigstens temporaren 

30 Anwendungsimplementierung fur die wenigstens eine 

Telekommunikationsendeinrichtung (100) umfasst. 

24. System nach einem der vorstehenden Anspruche, ferner 
gekennzeichnet durch ein serverbasiertes 
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Spracherkennungssystem (300) und ein Tarif fierungs- 
und/oder Billingsystem (500) . 

25. System nach einem der vorstehenden Anspruche, femer 
gekennzeichnet durch wenigstens einen WEB-Server zum 
Bereitstellen des Dienstservers (400), des 
serverbasierten Spracherkennungs systems (300) und/oder 
des Tarif fierungs- und/oder Billingsystems (500) . 

26. System nach einem der vorstehenden Anspruche, femer 
gekennzeichnet durch Schnittstellenmittel zum Aufbauen 
von Kommunikationsverbindungen (1, 2, 3) zwischen der 
Telekommunikationsendeinrichtung (100) , dem 
Dienstserver (400) und/oder dem Serverbasierten 
Spracherkennungssystem (300) . 

27. System nach einem der vorstehenden Anspruche, femer 
gekennzeichnet durch Schnittstellenmittel zum Aufbauen 
von Verbindungen (1, 2, 3, 4) zur Signalubertragung 
zwischen der Telekommunikationsendeinrichtung (100) , 
dem Dienstserver (400), dem Serverbasierten 
Spracherkennungssystem (300) und/oder dem 
Tariffierungs- und/oder Billingsystem (500) . 

28. System nach einem der vorstehenden Anspruche, femer 
gekennzeichnet durch Mittel zum Bereitstellen einer 
Kommunikationsverbindung (5, 6) zwischen dem 
Dienstserver (400) und/oder dem Serverbasierten 
Spracherkennungssystem (300) und dem Tarif fierungs- 
und/oder Billingsystem (500) . 



29. System nach einem der vorstehenden Anspruche, femer 
umfassend ein zur Ubertragung von Sprachsignalen 
ausgebildetes Telekommunikationsnetz (200) , 
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insbesondere wenigstens ein Mobilfunknetz, Festnetz, 
(W) LAN und/oder das Internet umfassend. 

30. System nach einem der vorstehenden Ansprttche dadurch 
gekennzeichnet, dass ein Verbindungsaufbau zwischen der 
Telekommunikationsendeinrichtxing (100) , dem 
Dienstserver (400) , dem Serverbasierten 
Spracherkennungssystem (300) und/oder dem 
Tariffierungs- und/oder Billingsystem (500) unter 
Verwendung von jeweils zugeordneten Rufkennungen 

erf olgt . 

31. System nach einem der vorstehenden Ansprttche 
gekennzeichnet durch Mittel zum Umsetzen eines 
Sprachsignal zwischen unterschiedlichen 

Fr equenzbandern • 

32. System nach einem der vorstehenden Ansprttche, ferner 
gekennzeichnet durch der 
Telekommunikationsendeinrichtung (100) , 
Spracherkennungssystem (300) und/oder dem Dienstserver 
(400) zugeordnete Mittel zum Ausw^hlen eines aktuell 
von der Telekommunikationsendeinrichtung (100) 

an z uwendenden Algorithmus. 

33. System nach einem der vorstehenden Ansprttche, ferner 
gekennzeichnet durch der 
Telekommunikationsendeinrichtung (100) , 
Spracherkennungssystem (300) und/oder dem Dienstserver 
(400) zugeordnete Mittel zur Uberprttfung eines aktuell 
angewendeten oder an z uwendenden Algorithmus, 

34. System nach einem der vorstehenden Ansprttche, ferner 
gekennzeichnet durch der 
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Telekommunikationsendeinrichtung (100) , 
Spracherkennungssystem (300) und/oder dem Dienst server 
(400) zugeordnete Mittel zur Generierung eines 
Testsignals, welches zur Oberprttfung eines aktuell 
angewendeten oder anzuwendenden Algorithmus uber 
wenigstens einen Lautsprecher (108, 110) der 
Telekommunikationsendeinrichtung (100) ausgegeben und 
mit einem uber wenigstens ein Mikrofon (107, 109) der 
Telekommunikationsendeinrichtung (100) empfangenen 
Antwortsignal verglichen wird. 

35. Serverbasiertes Spracherkennungssystem (300) fur ein 

System nach einem der vorstehenden Ansprttche, umfassend 
Mittel zur Auswahl wenigstens eines auf einem 
Dienstserver (400) bereitgestellten 
Sprachverarbeitungsalgorithmus , insbesondere 
Freisprech- , Echokompensations- , 
Sprecherverif izierungs- , -erkennungs- , 
-klassif izierungs- , Sprachverif izierungs- , 
0 -erkennungs-, n Text-To-Speech"- und/oder 

Gerauschreduktionsalgorithmus, zum wenigstens 
temporaren Laden und Implementieren auf einer 
bestimmten Telekommunikationsendeinrichtung (100) unter 
Ansprechen auf der Telekommunikationsendeinrichtung 
5 (100) zugeordneten Kennungsungsparametem . 

36. Dienstserver (400) far ein System nach einem der 

vorstehenden Ansprttche, umfassend Mittel zur Auswahl 
wenigstens eines auf dem Dienstserver (400) 
0 bereitgestellten sprachverarbeitungsalgorithmus, 

insbesondere Freisprech-, Echokompensations-, 
Spr echerver i f i zi erungs - , - erkennungs - , 
-klassif izierungs- , Sprachverif izierungs- , 
-erkennungs-, w Text-To-Speech"- und/oder 
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Gerauschreduktionsalgorithmus zum wenigstens temporaren 
Laden und implementieren auf wenigstens einer 
bestimmten Telekommunikationsendeinrichtung (100) unter 
Ansprechen auf der Telekommunikationsendeinrichtung 
5 (100) zugeordneten Kennungsparameter . 

37. Tariffierungs- und/oder Billingsystem (500) fur ein 

System nach einem der vorstehenden Anspriiche, umfassend 
Mittel zur Tariffierung eines einer bestimmten 
10 Telekommunikationsendeinrichtung (100) von einem 

Serverbasierten Spracherkennungssystem (300) wenigstens 
temporar bereitgestellten Dienstes und/oder eines von 
einem Dienstserver (400) wenigstens temporar geladenen 
Programms zur Realisierung eines 
15 sprachverarbeitungsalgorithmus, insbesondere 

Freisprech-, Echokompensations-, 
Sprecherverif izierungs- , -erkennungs- , 
-klassif izierungs- , Sprachverif izierungs- , 
-erkennungs-, * Text -To -Speech"- und/oder 
20 Gerauschreduktionsalgorithmus unter Ansprechen auf der 

Telekommunikationsendeinrichtung (100) zugeordnete 
Kennungs- und/oder Tariff ierungsparameter . 

38. Telekommunikationsendeinrichtung (100) fiir ein System 
25 nach einem der vorstehenden Anspriiche, umfassend Mittel 

(101, 103) zum wenigstens temporaren Laden wenigstens 
eines Sprachverarbeitungsalgorithmus von einem 
Dienstserver (400) und zum temporaren implementieren. 

30 39. Telekommunikationsendeinrichtung (100) nach 

vorstehendem Anspruch, umfassend Mittel (101, 103) zum 
wenigstens temporaren Laden wenigstens eines 
Freisprech-, Echokompensations-, Stimmen- und/oder 
Sprachverif izierungs- und/oder 
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Gerauschreduktionsalgorithmus von dem Dienstserver 
(400) und zum temporaren Implementieren. 

40. Telekommunikationsendeinrichtung (100) nach einem der 
vorstehenden Ansprttche, femer umfassend einen 
Prozessor zum Ausfuhren des implementierten 
Algorithmus . 

41. Telekommunikationsendeinrichtung (100) nach einem der 
vorstehenden Ansprttche, welche als mobile 
Telekommunikationsendeinrichtung ausgebildet ist, 
insbesondere als PDA, MDA, Mobiltelefon oder DECT- 
Telef on. 

42. Telekommunikationsendeinrichtung (100) nach einem der 
vorstehenden Anspruche, welches auf einem GSM-Standard 
oder UMTS-Standard basiert. 

43. Telekommunikationsendeinrichtung (100) nach einem der 
vorstehenden Ansprttche, ferner umfassend einen A/D- 
Wandler (104) und einen D/A-Wandler (105) . 

44. Telekommunikationsendeinrichtung (100) nach 
vorstehendem Anspruch, ferner umfassend eine 
Einrichtung (106) zum Kalibrieren des A/D-Wandler (104) 
und des D/A-Wandler (105) und/ oder zum Durchfiihren 
einer digitalen Kalibrierung. 

45. Tel ekommunikat ions endeinrichtung nach vorstehendem 
Anspruch, welche ausgebildet ist die Kalibrierung unter 
Verwendung eines Sprachsignals und/oder eines 
Testsignals als Abgleichsignal selbsttatig 

durchzuf tihren . 
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46. Telekommunikationsendeinrichtung (100) nach einem der 
vorstehenden Anspriiche, ferner umfassend eine 
Kodiereinrichtung (102) . 

47. Telekommunikationsendeinrichtung (100) nach einem der 
vorstehenden Anspriiche, gekennzeichnet durch eine 
Einrichtung zum Umsetzen eines Sprachsignals zwischen 
unterschiedlichen Frequenzbandern . 



10 48. Telekommunikationsendeinrichtung (100) nach einem der 

vorstehenden Anspriiche, ferner umfassend 
Schnittstellenmittel zum drahtgebundenen und/oder 
drahtlosen Anschalten wenigstens eines externen 
Mikrofons (109) und/oder Lautsprechers (110) . 

15 

49. Telekommunikationsendeinrichtung (100) nach einem der 
vorstehenden Ansprttche, ferner umfassend wenigstens 
einen Mikrof onkanal und/oder Lautsprecherkanal , 
insbesondere wenigstens zwei Mikrof onkanale und/oder 
20 Lautsprecherkanale, und/oder Mittel zur Mehrkanal- 

Signalubertragung . 
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